07. SageMaker 上传至 S3 bucket
S3 就是 Simple Storage Service的简称。
另一个新的SageMaker 的用法 是数据存储方法。我们主要使用 S3 bucket 来存储数据。S3是一种虚拟存储解决方案,主要用于将数据写入少量数据并多次读取。从某种意义上说,这是使用亚马逊服务时,数据存储和传输的主要工具。他们的存储类似于包含有关该数据和元数据的文件夹,例如数据大小,上载日期,作者等。
将数据上载到 Sessions 后,你应该看到创建了一个S3 bucket,如下所示的输出所示:
INFO: sagemaker: Created S3 bucket: <message specific to your locale, ex. sagemaker-us-west-1-*#>*
如果您想了解有关我们如何创建csv文件的更多信息,可以查看pandas文档https://pandas.pydata.org/pandas-docs/stable/generated/pandas.concat.html。在这里,我们只是将x和y数据集连接为数据列(axis = 1),并使用.to_csv将pandas数据帧转换为csv文件。